词与句嵌入
Embedding 暴露系统内置的词嵌入和句嵌入:稠密向量,用于相似度计算、最近邻搜索、距离度量。
没有公共构造函数 —— 必须通过 static 工厂方法获取实例。
静态工厂
Embedding.wordEmbedding(language, revision?): Embedding | null
获取 language 的内置词嵌入。在当前 OS 上没有该语言的 embedding 时返回 null。
Embedding.sentenceEmbedding(language, revision?): Embedding | null
获取 language 的内置句嵌入(iOS 14+)。iOS 13 或没有可用句嵌入时返回 null。
属性
查询方法
contains(token: string): boolean
判断 token 是否在词表中。
vector(token: string): number[] | null
返回 token 的向量(长度等于 dimension),不在词表中时返回 null。
distance(first, second, type?): number | null
两个 token 之间的 cosine 距离([0, 2],越小越近)。
任一 token 不在词表时返回 null —— 用 contains 可以区分 "查不到" 与 "真的很远"。
neighbors(token, maximumCount, type?): { token, distance }[]
返回 token 最近的最多 maximumCount 个邻居,按距离升序。token 不在词表时返回 []。
示例
词相似度
最近邻
拿原始向量
注意事项
wordEmbedding("en")是最稳定可用的 embedding。其他语言依 OS 版本而定,有些会返回null。distanceType目前仅支持"cosine",参数预留给未来扩展。
